我们考虑将贝叶斯网络表征到无条件等效的问题,即,当定向无环形图(DAGS)具有相同的无条件$ d $分离式语句。每个无条件的等效类(UEC)均以一个无方向的图形为唯一表示,其集团结构编码了类的成员。通过这种结构,我们提供了无条件对等的变革性表征。也就是说,我们证明当一个DAG在同一UEC中,并且仅当一个可以通过有限的指定移动序列转换为另一个DAG。我们还将此特征扩展到代表UEC中Markov等效类(MEC)的基本图。UEC分配了MEC的空间,并且可以从边际独立性测试中估算。因此,无条件等价的表征在涉及搜索贝叶斯网络空间的方法中应用。
translated by 谷歌翻译
网络对齐或在不同网络中查找相应节点的任务是许多应用程序域中的重要问题。我们提出了CAPER,这是一个多级比对框架,它使输入图更粗糙,将粗糙的图对齐,将对齐解决方案投射到更精细的级别并完善对齐解决方案。我们表明,CAPER可以通过在多个图形分辨率上执行对齐一致性来改善许多不同的现有网络对齐算法:在更较高的级别上,匹配的节点也应在更粗的级别匹配。CAPER还可以通过允许其在输入图的较小的粗糙版本上运行,以线性时间的粗化和完善步骤的适度成本加速使用较慢的网络对齐方法。实验表明,刺山柑可以对不同的网络比对方法的改进,其准确性和/或运行时的准确性和/或数量级平均可以提高33%。
translated by 谷歌翻译
对自我监督学习(SSL)的最新分析发现,以下以数据为中心的属性对于学习良好表示至关重要:对任务 - 无关紧要的语义的不变性,在某些潜在空间中的类别可分离性以及从增强样品中可恢复标签的类别。但是,鉴于它们的离散,非欧成功的性质,图形数据集和图SSL方法不太可能满足这些属性。这提出了一个问题:如何绘制SSL方法(例如对比度学习(CL))如何工作?为了系统地探究这个问题,我们在使用通用图扩展(GGAS)时对CL进行概括分析,重点是以数据为中心的属性。我们的分析对GGA的局限性以及与任务相关的增强的必要性产生了正式见解。正如我们经验表明的那样,GGA不会在共同基准数据集上引起与任务相关的不变性,这只会导致对天真的,未经训练的基线的边际收益。我们的理论激发了合成数据生成过程,该过程能够控制与任务相关的信息并拥有预定义的最佳增强。这种灵活的基准测试有助于我们确定高级增强技术(例如自动化方法)中未认可的限制。总体而言,我们的工作在经验和理论上都严格地对以数据为中心的属性对图形SSL的增强策略和学习范式的影响进行了严格的背景。
translated by 谷歌翻译
虽然直接进行微调(FT)大规模调查,但在特定于任务数据上进行了预定的模型,众所周知,可以引起强大的分配任务绩效,但最近的作品表明,不同的适应协议,例如线性探测(LP),例如线性探测(LP) ft,可以改善分布的概括。但是,此类适应协议的设计空间仍未探索,并且对此类协议的评估主要集中在分配转移上。因此,在这项工作中,我们评估了跨分布转移和机器学习安全指标(例如,异常检测,校准,对腐败的鲁棒性)的共同适应协议。我们发现协议引起了不同的权衡,这些权衡从事先评估中显而易见。此外,我们证明,适当的数据增强和协议可以大大减轻这种权衡。最后,我们假设并从经验上看到,在LP期间使用促进硬度的增强功能,然后使用增强功能对ft进行ft可能对缓解折衷尤其有效。
translated by 谷歌翻译
我们研究图形神经网络(GNN)的节点分类任务,并在群体公平性(通过统计平等和均等机会衡量)之间建立联系,以及局部分类性,即连接节点的趋势具有相似的属性。这种分类性通常是由同质性诱导的,即相似特性的节点连接的趋势。同质性在社交网络中可能很常见,在社交网络中,系统性因素迫使个人进入具有敏感属性的社区。通过合成图,我们研究了本地发生的同质和公平预测之间的相互作用,发现并非所有节点邻居在这方面都相等 - 社区以敏感属性的一类类别为主导,通常会努力获得公平的治疗,尤其是在分化本地类别和敏感属性同质。在确定存在局部同质和公平之间的关系之后,我们研究了不公平的问题是否与应用的GNN模型的设计相关联。我们表明,通过采用能够处理拆卸组标签的异性GNN设计,与真实和合成数据集中的同质设计相比,可以将本地异性邻居中的群体公平提高25%。
translated by 谷歌翻译
图表示学习在许多图挖掘应用中都起着重要作用,但是大规模图的学习嵌入仍然是一个问题。最近的工作试图通过图形摘要提高可扩展性 - 即,他们在较小的摘要图上学习嵌入,然后还原原始图的节点嵌入。但是,所有现有的作品都取决于启发式设计和缺乏理论分析。与现有作品不同,我们根据引入的内核矩阵对三种特定的嵌入学习方法进行了深入的理论分析,并揭示了通过图形摘要的学习嵌入实际上是在配置模型构造的近似图上学习嵌入的嵌入。我们还对近似误差进行了分析。据我们所知,这是对这种方法进行理论分析的第一项工作。此外,我们的分析框架可以解释某些现有方法,并为对此问题的未来工作提供了很好的见解。
translated by 谷歌翻译
神经网络(NNS)在广泛的应用中的成功导致对理解这些模型的潜在学习动态的兴趣增加。在本文中,我们通过采用图形透视并调查NNS图形结构与其性能之间的关系来超越学习动态的描述。具体地,我们提出(1)表示神经网络学习过程作为时间不断发展的图表(即,通过时代的一系列静态图形快照),(2)在简单的时间内捕获NN期间NN的结构变化发明内容,(3)利用结构摘要,以预测底层NN在分类或回归任务中的准确性。对于NNS的动态图形表示,我们探索完全连接和卷积层的结构表示,这是强大的NN模型的关键组件。我们的分析表明,图形统计数据简单摘要,如加权程度和特征向量中心,只能用于准确地预测NNS的性能。例如,基于Lenet架构的5次训练时期构造的基于加权的基于程度的概要,实现了超过93%的分类精度。我们的发现对于不同的NN架构,包括Lenet,VGG,AlexNet和Reset。
translated by 谷歌翻译
图表分类具有生物信息学,社会科学,自动假新闻检测,Web文档分类等中的应用程序。在许多实践方案中,包括网络级应用程序,其中标签稀缺或难以获得,无人监督的学习是一种自然范式,但它交易表现。最近,对比学习(CL)使得无监督的计算机视觉模型能够竞争对抗监督。分析Visual CL框架的理论和实证工作发现,利用大型数据集和域名感知增强对于框架成功至关重要。有趣的是,图表CL框架通常会在使用较小数据的顺序的同时报告高性能,并且使用可能损坏图形的底层属性的域名增强(例如,节点或边缘丢弃,功能捕获)。通过这些差异的激励,我们寻求确定:(i)为什么现有的图形Cl框架尽管增加了增强和有限的数据; (ii)是否遵守Visual CL原理可以提高图形分类任务的性能。通过广泛的分析,我们识别图形数据增强和评估协议的缺陷实践,这些协议通常用于图形CL文献中,并提出了未来的研究和应用的改进的实践和理智检查。我们表明,在小型基准数据集上,图形神经网络的归纳偏差可以显着补偿现有框架的局限性。在采用相对较大的图形分类任务的研究中,我们发现常用的域名忽视增强的表现不佳,同时遵守Visual Cl中的原则可以显着提高性能。例如,在基于图形的文档分类中,可以用于更好的Web搜索,我们显示任务相关的增强提高了20%的准确性。
translated by 谷歌翻译
我们通过形式化节点标签的异质性(即连接的节点倾向于具有不同的标签)和GNN与对抗性攻击的稳健性来弥合图形神经网络(GNN)的两个研究方向。我们的理论和经验分析表明,对于同质图数据,有影响力的结构攻击始终导致同质性降低,而对于异性图数据,同质级别的变化取决于节点度。这些见解对防御对现实图形的攻击具有实际含义:我们推断出分离自我和邻居限制的汇总器,这是一种已确定的设计原则,可以显着改善异性图数据的预测,还可以为增强的鲁棒性提供稳健性gnns。我们的综合实验表明,与表现最好的未接种模型相比,GNN仅采用这种设计可以提高经验和可证明的鲁棒性。此外,与表现最佳的疫苗接种模型相比,这种设计与对抗性攻击的明确防御机制相结合,可提高稳健性,攻击性能在攻击下提高18.33%。
translated by 谷歌翻译
在节点分类任务中,异常和过天性是两个可能损害图形卷积神经网络(GCN)性能的两个问题。异种源于问题是指模型无法处理异构节点属于不同类别的异细则图;过度问题是指模型的退化性能随着越来越多的层。这两个看似无关的问题大多是独立研究的,但最近有近期解决一个问题可能有益于另一个问题的经验证据。在这项工作中,除了经验观察之外,我们的目标是:(1)从统一的理论角度分析异常和过天际上的问题,(2)确定两个问题的共同原因,(3)提出简单但有效的解决策略共同的原因。在我们的理论分析中,我们表明异通源性和过天际上问题的共同原因 - 即节点的相对程度及其异常级别 - 触发连续层中的节点表示,以“移动”更靠近原始决策边界,这增加了某些约束下节点标签的错误分类率。理论上我们显示:(1)具有高异味的节点具有更高的错误分类率。 (2)即使在异常的情况下,节点邻域中的程度差异也可以影响节点表示的运动并导致“伪异性”情况,这有助于解释过度处理。 (3)允许在消息传递期间肯定的阳性而且负面信息可以有助于抵消两个问题的常见原因。基于我们的理论见解,我们提出了对GCN架构的简单修改(即学习程度校正和签名消息),我们表明他们在9个网络上缓解了HeteOlephily和过天际上的问题。
translated by 谷歌翻译